你可能还想看
1. 面向实时机器学习的算法接口与迭代引擎
2. SLS 数据加工最新技术总结
3. 阿里10年技术人:Leader的7种思考方式
4. SLS 智能告警平台最新技术总结
5. 6年团队Leader: 程序员的8种软技能
关注我们欢迎关注加星标✨ 每日推送不错过
The following article is from 达摩院DAMO Author 达摩院
凌云时刻
首先,针对图像、文本、坐标等不同模态信息,OFA 设计了兼容的输入和输出格式,将它们融入到统一词表中。
最后,针对效果优化,OFA 增加了 Trie 树实现帮助模型在分类任务上能够取得稳定的效果提升且不会输出集合外的标签。
当前,OFA 已能实现图像生成、图文描述、视觉问答、物体指代等多个任务,并在开放域数据和零样本学习场景中有优异表现。
基于给定文本的真实图像生成
基于给定文本的反事实图像生成
基于不同风格的艺术创作
开放域图文问答
未知领域的物体指代
M6-OFA 位列 MSCOCO Image Captioning 官方榜首
成绩得来不易。但在多任务渐成潮流的背景下,仍有很多重要的技术问题没有被回答,例如如何分配任务权重以实现最优调度,从而达到帕累托平衡。达摩院也已启动相关工作,并发现去掉图像还原能够为 VQA 任务带来明显的效果提升,去掉纯文本则能能让图片分类任务实现最大增益。
Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning Framework
【论文地址】
https://arxiv.org/pdf/2202.03052.pdf
【开源地址】
https://github.com/OFA-Sys/OFA
【交互式 Demo 地址】
欢迎关注加星标✨ 每日推送不错过